Modul 15 von 15 · 📖 8 min Lesezeit · ⏱ 30 min gesamt
FI-DPA 15 MLOps — Modelle produktiv betreiben
Inhaltsverzeichnis (6 Abschnitte)
FI-DPA 15 MLOps — Modelle produktiv betreiben
In diesem Modul erlernen Sie die Konzepte und praktischen Umsetzungsschritte, um maschinelle Lernmodelle zuverlässig in Produktion zu betreiben. Sie verstehen, wie Sie Modelle versionieren, überwachen und bei Bedarf automatisch aktualisieren können, während Sie gleichzeitig ethische Aspekte und die Erklärbarkeit der Modelle berücksichtigen.
Konzepte und Hintergrund
- Model Registry
- Ein zentraler Speicherort für alle Modelle in verschiedenen Versionen, der Metadaten und den Lebenszyklus verwaltet.
- Versionierung
- Das Systematischen Speichern von Modellen mit eindeutigen Identifikatoren, um Reproduzierbarkeit und Rollbacks zu ermöglichen.
- A/B-Testing
- Ein Verfahren zum Vergleich zweier Modelle, bei dem verschiedene Benutzergruppen unterschiedliche Versionen erhalten, um die Leistung objektiv zu bewerten.
- Drift Detection
- Die kontinuierliche Überwachung von Modellausgaben und Eingabedaten auf Abweichungen vom erwarteten Verhalten, die zu Leistungseinbußen führen können.
- Explainable AI (XAI)
- Methoden zur Erklärung von Vorhersagen maschineller Lernmodelle, um Transparenz und Vertrauen in die Ergebnisse zu schaffen.
Architektur-Diagramm
flowchart LR
A[Datenquelle] --> B[Datenvorverarbeitung]
B --> C[Modelltraining]
C --> D[MLflow Registry]
D --> E[Modellauslieferung]
E --> F[A/B-Testing]
F --> G[Überwachung]
G --> H[Drift Detection]
H --> I{Drift erkannt?}
I -->|Ja| J[Retraining]
I -->|Nein| K[Produktivbetrieb]
J --> C
Praktische Schritte
- MLflow Server installieren und konfigurieren. Dies dient als zentrale Plattform für die Verwaltung Ihrer Modelle.
- Ein MLflow Experiment für Ihr Projekt erstellen, um alle Runs und Modelle zu gruppieren.
- Ein Modell trainieren und automatisch in der MLflow Registry registrieren.
- Eine Version des Modells für den A/B-Test markieren und bereitstellen.
- Eine Überwachungspipeline für Daten- und Konzeptdrift implementieren.
- Einen Retraining-Workflow mit Apache Airflow oder ähnlichen Tools erstellen.
- Eine SHAP-Integration für die Erklärbarkeit der Modellevorhersagen implementieren.
- Ethische Guidelines für die Modellevaluation und -auswahl festlegen.
pip install mlflow
mlflow server --host 0.0.0.0 --port 5000
mlflow create experiment --experiment-name "Kundenklassifizierung"
mlflow.sklearn.log_model(
sk_model=model,
artifact_path="model",
registered_model_name="kunden_churn_model"
)
client = MlflowClient()
client.transition_model_version_stage(
name="kunden_churn_model",
version=1,
stage="Staging"
)
from evidently.report import Report
from evidently.metrics import DataDriftMetric
report = Report(metrics=[DataDriftMetric()])
report.run(reference_data=reference_df, current_data=new_data)
import shap
explainer = shap.TreeExplainer(model)
shap_values = explainer.shap_values(X_test)
Häufige Fallstricke
Weiterführende Ressourcen
- MLflow offizielle Dokumentation
- Evidently - Plattform für ML-Monitoring
- SHAP Dokumentation für Modellexplainability
- Buch: Designing Machine Learning Systems
- Coursera Kurs: Machine Learning Engineering for Production (MLOps) Specialization
Wissens-Check
Vier Fragen zur Selbstkontrolle. Klicken Sie jede Frage an, um die richtige Antwort und Erklärung zu sehen.
Was ist der primäre Zweck eines Model Registry in MLOps?
- A) Das automatische Training von Modellen
- B) Ein zentraler Speicherort für Modelle in verschiedenen Versionen mit Metadaten-Verwaltung
- C) Die Visualisierung von Modellausgaben
- D) Die Datenerfassung für das Training
Richtige Antwort: B. Ein Model Registry dient als zentraler Speicher für Modelle in verschiedenen Versionen und verwaltet deren Metadaten und Lebenszyklus. Option A beschreibt das Training, nicht die Speicherung. Option C ist Aufgabe von XAI-Tools und Option D betrifft die Datenvorverarbeitung.
Was ist der Hauptzweck von A/B-Testing im Kontext von ML-Modellen?
- A) Die automatische Aktualisierung von Modellen
- B) Die kontinuierliche Überwachung von Modellausgaben
- C) Der objektive Vergleich von zwei Modellen durch den Einsatz an verschiedenen Benutzergruppen
- D) Die Erklärung von Modellausgaben
Richtige Antwort: C. A/B-Testing vergleicht zwei Modelle, indem verschiedene Benutzergruppen unterschiedliche Versionen erhalten, um die Leistung objektiv zu bewerten. Option A beschcribes Retraining, Option B ist Drift Detection und Option D ist Aufgabe von XAI.
Was ist Explainable AI (XAI) im Kontext von MLOps?
- A) Ein Verfahren zur automatischen Modelloptimierung
- B) Methoden zur Erklärung von Modellausgaben für Transparenz und Vertrauen
- C) Ein System zur Versionsverwaltung von Trainingsdaten
- D) Ein Protokoll für die Modellbereitstellung
Richtige Antwort: B. XAI umfasst Methoden zur Erklärung von Vorhersagen maschineller Lernmodelle, um Transparenz und Vertrauen zu schaffen. Option A beschreibt Hyperparameter-Optimierung, Option C ist Teil der Datenverwaltung und Option D bezieht sich auf Deployment-Prozesse.
Was passiert im MLOps-Lebenszyklus, wenn ein Drift erkannt wird?
- A) Das Modell wird automatisch in der Registry archiviert
- B) Das System führt automatisch ein Retraining durch
- C) Das System benachrichtigt den Administrator per E-Mail
- D) Das System setzt den Produktivbetrieb fort
Richtige Antwort: B. Bei erkanntem Drift führt das System gemäß dem gezeigten Architektur-Diagramm ein Retraining durch, um die Modellleistung wiederherzustellen. Option A ist kein automatischer Prozess, Option C ist nur ein Teil der Lösung und Option D wäre bei erkanntem Drift nicht korrekt.